do eda ne demek?

**EDA (Exploratory Data Analysis - Keşifsel Veri Analizi)**

EDA, bir veri kümesini özetlemek, görselleştirmek ve temel özelliklerini anlamak için kullanılan bir yaklaşımdır. Amaç, verideki kalıpları, ilişkileri, aykırı değerleri ve potansiyel sorunları ortaya çıkarmaktır. EDA, veri modelleme veya hipotez testinden önce yapılması gereken kritik bir adımdır ve veri hakkında daha derin bir anlayış sağlayarak daha iyi karar verme süreçlerine katkıda bulunur.

**EDA'nın Temel Bileşenleri:**

*   **Veri Toplama ve Temizleme:**
    Verinin toplanması, entegre edilmesi ve veri kalitesini artırmak için eksik verilerin ele alınması, aykırı değerlerin belirlenmesi ve düzeltilmesi gibi temizleme işlemleri yapılır. Bu süreç, veri analizinin güvenilirliğini artırır.

*   **Veri Özetleme:**
    Verinin temel istatistiklerinin (ortalama, medyan, standart sapma, vb.) hesaplanması ve görselleştirilmesi ile verinin genel özelliklerinin anlaşılması sağlanır. Bu, verinin dağılımı, merkezi eğilimleri ve değişkenliği hakkında bilgi sağlar.

*   **Veri Görselleştirme:**
    Histogramlar, dağılım grafikleri, kutu grafikleri, ısı haritaları vb. gibi çeşitli grafikler kullanılarak verinin görsel olarak incelenmesi sağlanır. Bu, verideki kalıpları, ilişkileri ve aykırı değerleri daha kolay tespit etmeye yardımcı olur. [Veri Görselleştirme](https://www.nedemek.page/kavramlar/veri%20görselleştirme)

*   **Aykırı Değer Tespiti:**
    Aykırı değerlerin (normalden çok farklı değerler) belirlenmesi ve bunların veri setine etkilerinin değerlendirilmesi önemlidir. Aykırı değerler, hatalı veri girişinden kaynaklanabileceği gibi, önemli bir olayın göstergesi de olabilir. [Aykırı Değer](https://www.nedemek.page/kavramlar/aykırı%20değer)

*   **Değişkenler Arası İlişkilerin İncelenmesi:**
    Değişkenler arasındaki korelasyonun veya bağımlılığın incelenmesi, hangi değişkenlerin birlikte hareket ettiğini veya birbirini etkilediğini anlamaya yardımcı olur. Bu, özellik mühendisliği veya modelleme için önemli bilgiler sağlar. [Korelasyon](https://www.nedemek.page/kavramlar/korelasyon)

**EDA'nın Faydaları:**

*   Veri kalitesini değerlendirme ve iyileştirme
*   Veri setindeki kalıpları ve ilişkileri ortaya çıkarma
*   Aykırı değerleri ve potansiyel hataları tespit etme
*   Modelleme için uygun değişkenleri belirleme
*   Hipotez geliştirme ve test etme
*   Daha iyi karar verme süreçlerine katkıda bulunma

**EDA Araçları:**

*   **Python:** Pandas, NumPy, Matplotlib, Seaborn gibi kütüphaneler.
*   **R:** ggplot2, dplyr gibi paketler.
*   **Tableau, Power BI:** Görselleştirme araçları.

EDA, veri bilimi projelerinin olmazsa olmaz bir parçasıdır ve veri hakkında sağlam bir anlayış geliştirmek için kritik bir adımdır.